html = """
<!DOCTYPE html>
<html>
<head lang='en'>
 <meta charest='utf-8'>
 <title></title>
</head>
<body>
 <div id="test-1">需要的内容1</div>
 <div id="test-2">需要的内容2</div>
 <div id="shujia">需要的内容3</div>
</body>
</html>
"""

# 安装lxml: pip install lxml

from lxml import etree

# 将html文本转换成对象
etree_html = etree.HTML(html)

# 使用xpath解析html文件
# //: 代表全局查找
# //div： 再全局查找div这个标签
# starts-with(@id,"test")： 标签的id属性是test开头
# text()： 获取标签中的文本内容
content = etree_html.xpath('//div[starts-with(@id,"test")]/text()')

print(content)
